#большие маржинальные данные09.11.2025
Step-Audio-EditX: открытая 3B аудио LLM, позволяющая редактировать речь как текст
Step-Audio-EditX — открытая 3B аудио LLM, которая переводит редактирование речи в токенное пространство, позволив итеративно и точно править эмоцию, стиль и паралингвистику с помощью синтетических данных и PPO.